Word til ren HTML
==================

Dette er et Windows-program som konverterer Microsoft Word-filer i .docx-format til ren, semantisk HTML.

Slik starter du:
1. Kjør "WordTilRenHTML.exe".
2. Trykk "Bla gjennom..." for å velge en Word-fil med Windows sin vanlige åpne-dialog.
3. Trykk "Konverter".
4. Bruk knappene for å kopiere full HTML, kopiere bare main-seksjonen, eller lagre en HTML-fil.

Distribusjon:
- "WordTilRenHTML.exe" er bygget som én enkelt Windows-fil og krever ikke at mottakeren installerer Python.
- Denne versjonen bruker standard Windows-kontroller, ikke Tkinter. Det gir tydeligere knapper, tekstfelt og labels for skjermlesere.
- Programmet bruker Microsoft .NET Framework, som normalt finnes på moderne Windows-maskiner.
- Programmet er ikke digitalt signert. Windows SmartScreen kan derfor vise en advarsel første gang programmet startes.

Tilgjengelighet:
- Programmet bruker standard Windows-kontroller fra Tkinter, som fungerer med tastatur og skjermlesere.
- Tab flytter mellom felt og knapper.
- Ctrl+O velger fil.
- Ctrl+R konverterer.
- Ctrl+Shift+C kopierer main-seksjonen etter konvertering.

Hva konverteres:
- Overskrifter, avsnitt, sitater, tabeller, lister, lenker, bokmerker, interne lenker, fotnoter, sluttnoter og bilder.
- Programmet leser Word-stiler fra dokumentet, slik at overskriftsstiler blir h-tagger og listestiler blir HTML-lister.
- Programmet leser også Word sin disposisjonssemantikk (outline level). Det gjør at Overskrift 1/2/3 osv. blir riktige h1/h2/h3-tagger selv når Word lagrer overskriften som stilinformasjon.
- Overflødig fetmarkering i overskrifter fjernes når selve h-taggen allerede uttrykker semantikken, også når Word har delt overskriften i flere tekstdeler.
- Tabellrader som er merket som overskriftsrader i Word blir tabelloverskrifter i HTML.
- Bilder legges inn som data-URI i HTML-filen, slik at full HTML kan kopieres som én komplett fil.
- Alternativ tekst fra Word tas med når den finnes. Programmet gir merknad hvis et bilde mangler alternativ tekst.
- Norske tegn som æ, ø og å beholdes som vanlige tegn i HTML-koden.
- Hvis "head.html" ligger i samme mappe som WordTilRenHTML.exe, brukes den som starten på full HTML. Den må inneholde doctype, html-taggen og head.
- Hvis "head.html" ikke finnes, bruker programmet en generell standard-head med tom title og tomme Open Graph-felter.
- head.html kan også inneholde lokale valg som HTML-kommentarer. Disse fjernes fra ferdig HTML:
  <!-- WordTilRenHTML:main-id="main-content" -->
  <!-- WordTilRenHTML:first-h1-attributes='id="sideoverskrift" tabindex="-1"' -->
  <!-- WordTilRenHTML:after-first-paragraph-file="etter-forste-avsnitt.html" -->
  <!-- WordTilRenHTML:before-body-close-file="for-body-slutt.html" -->
- Filene som pekes til må ligge i samme mappe som WordTilRenHTML.exe.

Begrensninger:
- Programmet støtter .docx, ikke eldre .doc-filer.
- Kompleks Word-layout, farger, fonter og visuell styling tas bevisst ikke med.
- Noen avanserte Word-felt kan bli ren tekst eller utelates dersom Word ikke lagrer dem som vanlig dokumentstruktur.
